FILTER MODE ACTIVE

#Gemini 2.5 Pro

Найдено записей: 7

#Gemini 2.5 Pro06.11.2025

DS STAR: многоагентная система Google, превращающая разрозненные файлы в Python‑аналитику

'DS STAR — многоагентная система Google, которая переводит смешанные файлы в исполняемые Python‑скрипты через итеративное планирование и верификацию, значительно повышая точность на бенчмарках.'

#Gemini 2.5 Pro17.07.2025

Google Search получает крупное AI-обновление: Gemini 2.5 Pro, Deep Search и агентный интеллект

Google Search представил Gemini 2.5 Pro, Deep Search и агентные интеллектуальные функции, превращая поиск в умного и интерактивного помощника. Новые возможности доступны для пользователей из США с подпиской Pro.

#Gemini 2.5 Pro05.06.2025

WebChoreArena: Новый уровень тестирования AI-агентов с задачами на память и многопроцессное мышление

WebChoreArena представляет сложные задачи с памятью и рассуждениями для оценки AI-веб-агентов, выявляя серьёзные вызовы для современных моделей в отличие от простого серфинга.

#Gemini 2.5 Pro05.06.2025

Salesforce AI представляет CRMArena-Pro: первый корпоративный мульти-туровый бенчмарк для LLM-агентов

Salesforce AI представила CRMArena-Pro — первый корпоративный бенчмарк для тестирования LLM-агентов в сложных мульти-туровых бизнес-задачах, включая продажи, обслуживание и работу с конфиденциальной информацией.

#Gemini 2.5 Pro17.05.2025

Microsoft и Salesforce выявили значительное падение эффективности LLM в реальных многошаговых диалогах

Новое исследование Microsoft и Salesforce показывает, что большие языковые модели теряют до 39% эффективности при обработке реальных многошаговых диалогов с неполными инструкциями, выявляя ключевую проблему разговорного ИИ.